آزمایش هایی درباره تأثیر تحلیل گفتمان بر الگوریتم های رده بندی و بازیابی اطلاعات
نویسندگان
چکیده
پژوهشگران نظام های نمایه سازی و بازیابی، به منظور بهبود نتایج [جستجو]، همواره از گنجاندن اطلاعات بافتاری بیشتر، پشتیبانی کرده اند. افزایش شمار پایگاه های اطلاعاتی متن کامل و پیشرفت های به دست آمده در ظرفیت ذخیره سازی رایانه ای، تحلیل متن را با بهره گیری از دانش زبان شناسی و فرا- زبان شناسی امکان پذیر ساخته است. از میانه دهه 1980، پژوهشگران توجه و گرایش بیشتری به بافتار پیدا کرده اند، و تحلیل گفتمان نقش مهم تری یافته است. هدف پژوهش توصیف شده در این مقاله، بررسی این مسئله است که آیا متغیرهای گفتمان، بر الگوریتم های نوین بازیابی و رده بندی اطلاعات اثر می گذارند یا نه. به منظور ارزیابی این فرضیه، چارچوبی عملی برای تحلیل اطلاعات در محیطی خودکار پیشنهاد شده است. در این محیط، ان ـ گرام ها[4] (فیلترکردن) و کی ـ مینز (میانگین عددkا) و الگوریتم های رده بندی و چن با زیرمجموعه هایی از مدارک، برپایه متغیرهای گفتمانی «گونه»، «سیاق»، «اصطلاح شناسی حوزه» و «ساختار مدرک» مورد آزمون قرار گرفتند. نتایج حاصل از مطالعه الگوریتم های زیرمجموعه های مختلف، با ساختار اطلاعات « سرعنوان های موضوعی پزشکی» (مِش) مقایسه شد. این نتایج نشان می دهد که ان ـ گرام ها وابستگی واضحی به متغیرهای گفتمان ندارند؛ هرچند که الگوریتم رده بندی کی ـ مینز چنین وابستگی را، البته فقط در «اصطلاح شناسی حوزه» و «ساختار مدرک» نشان می دهد، و سرانجام این که «الگوریتم چن» وابستگی مشخصی به همه متغیرهای گفتمان دارد. از این اطلاعات می توان برای طراحی بهتر الگوریتم های رده بندی که باید متغیرهای گفتمان را مورد توجه قرار دهند، استفاده کرد. نتایج فرعی دیگری نیز از این پژوهش حاصل شده است که در مقاله ارائه می گردد.
منابع مشابه
تحلیل پاسخ های آمیخته گسسته و پیوسته رده بندی شده
در این مقاله، هدف ما ردهبندی پاسخهایی است که بهصورت آمیختهای از پاسخهای گسسته و پیوسته هستند. برای اینکار، ابتدا باید تابع توزیع توأم چنین پاسخهایی را داشته باشیم. بنابراین، مدل مکانی عام جدید را برای دستیابی به تابع توزیع توأم پاسخهای آمیختهی گسسته و پیوسته معرفی کردهایم و بهصورت اجمالی با مدل مکانی عام دِ لئون و کریر [1] مورد مقایسه قرار دادهایم. رویکرد مورد استفاده برای ردهبندی ...
متن کاملتأثیر القای هیجانی بر بازیابی اطلاعات
هدف: بررسی نقش القای هیجانی کاربران در بازیابی اطلاعات. روش/ رویکرد پژوهش: روش مورد استفاده، آزمایشی و از نظر هدف کاربردی محسوب میشود. جامعه آماری این پژوهش را دانشجویان کارشناسی ارشد رشتههای علوم انسانی دانشگاه بینالمللی امام رضا (ع) تشکیل میدادند که نمونهای شامل 42 نفر در دو گروه انتخاب گردید. اطلاعات لازم از طریق ابزارهای متعددی همانند پرسشنامه اطلاعات جمعیتشناختی و سابقه کار با اینترن...
متن کاملمروری بر رده بندی نظری و رده بندی عملی
طرحهای رده بندی را میتوان به دو دسته نظری و عملی تقسیم کرد. مهمترین ویژگی رده بندی عملی(رده بندی کتابخانه ای و رده بندی کتابشناسی)پیوند آن با طبقه بندی علوم است . میزان وابستگی و انطباق رده بندیهای عملی و نظری مسئله اساسی مورد بحث در این مقاله است. به منظور حفظ توالی منطقی و پیوستگی مطلوب موضوعها و دوام و پایداری رده بندی در کتابخانه ها باید نظم علمی اساس تنظیم کتب قرار گیرد‘اما در انطباق رده ب...
متن کاملالگوریتم بازیابی و رتبهبندی اطلاعات در موتور جستجوی گوگل
هدف اساسی این مقاله، تبیین نحوه عمل موتور جستجوی گوگل در رتبهبندی اطلاعات بازیابی شده است و بدین منظور، الگوریتم (خوارزمی) موتور جستجوی گوگل را در بازیابی و رتبهبندی اطلاعات بررسی میکند. در بخش اول – که text matching نامیده میشود – شیوه یافتن اطلاعات مرتبط با واژههای واردشده در جعبه جستجو، بهطور خلاصه بیان میگردد و در بخش دوم – که بخش اصلی مقاله است و PageRank نام دارد – شیوه رتبهبندی ن...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
پژوهشنامه پردازش و مدیریت اطلاعاتجلد ۲۰، شماره ۱، صفحات ۶۷-۹۵
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023